我们研究基于度量传输的非参数密度估计器的收敛性和相关距离。这些估计量代表了利息的度量,作为传输图下选择的参考分布的推动力,其中地图是通过最大似然目标选择(等效地,将经验性的kullback-leibler损失)或其受惩罚版本选择。我们通过将M估计的技术与基于运输的密度表示的分析性能相结合,为一般惩罚措施估计量的一般类别的措施运输估计器建立了浓度不平等。然后,我们证明了我们的理论对三角形knothe-rosenblatt(kr)在$ d $维单元方面的运输的含义,并表明该估计器的惩罚和未化的版本都达到了Minimax最佳收敛速率,超过了H \ \ \'“较旧的密度类别。具体来说,我们建立了在有限的h \“较旧型球上,未确定的非参数最大似然估计,然后在某些sobolev-penalate的估计器和筛分的小波估计器中建立了最佳速率。
translated by 谷歌翻译
我们考虑了使用显微镜或X射线散射技术产生的图像数据自组装的模型的贝叶斯校准。为了说明BCP平衡结构中的随机远程疾病,我们引入了辅助变量以表示这种不确定性。然而,这些变量导致了高维图像数据的综合可能性,通常可以评估。我们使用基于测量运输的可能性方法以及图像数据的摘要统计数据来解决这一具有挑战性的贝叶斯推理问题。我们还表明,可以计算出有关模型参数的数据中的预期信息收益(EIG),而无需额外的成本。最后,我们介绍了基于二嵌段共聚物薄膜自组装和自上而下显微镜表征的ohta-kawasaki模型的数值案例研究。为了进行校准,我们介绍了一些基于域的能量和傅立叶的摘要统计数据,并使用EIG量化了它们的信息性。我们证明了拟议方法研究数据损坏和实验设计对校准结果的影响的力量。
translated by 谷歌翻译
我们介绍了一种新颖的几何形状不可逆的扰动,该扰动加速了langevin算法的贝叶斯计算的收敛性。有充分的文献证明,兰格文动力学存在扰动,该动力学在加速其收敛的同时保留其不变度的度量。不可逆的扰动和可逆扰动(例如Riemannian歧管Langevin Dynamics(RMLD))已被单独显示以改善Langevin Samplers的性能。我们同时考虑了这两种扰动,通过呈现一种新型的RMLD不可逆扰动形式,该形式由基础几何形状告知。通过数值示例,我们表明,这种新的不可逆扰动可以改善估计性性能,而不是不可逆的扰动,而这些扰动不会考虑到几何。此外,我们证明,不可逆转的扰动通常可以与Langevin算法的随机梯度版本结合使用。最后,尽管连续的不可逆扰动不能损害兰格文估计器的性能,但考虑离散化时,情况有时会更加复杂。为此,我们描述了一个离散的示例,其中不可逆性增加了所得估计量的偏差和差异。
translated by 谷歌翻译
度量的运输提供了一种用于建模复杂概率分布的多功能方法,并具有密度估计,贝叶斯推理,生成建模及其他方法的应用。单调三角传输地图$ \ unicode {x2014} $近似值$ \ unicode {x2013} $ rosenblatt(kr)重新安排$ \ unicode {x2014} $是这些任务的规范选择。然而,此类地图的表示和参数化对它们的一般性和表现力以及对从数据学习地图学习(例如,通过最大似然估计)出现的优化问题的属性产生了重大影响。我们提出了一个通用框架,用于通过平滑函数的可逆变换来表示单调三角图。我们建立了有关转化的条件,以使相关的无限维度最小化问题没有伪造的局部最小值,即所有局部最小值都是全球最小值。我们展示了满足某些尾巴条件的目标分布,唯一的全局最小化器与KR地图相对应。鉴于来自目标的样品,我们提出了一种自适应算法,该算法估计了基础KR映射的稀疏半参数近似。我们证明了如何将该框架应用于关节和条件密度估计,无可能的推断以及有向图形模型的结构学习,并在一系列样本量之间具有稳定的概括性能。
translated by 谷歌翻译
Generative adversarial networks (GANs) are a class of machine-learning models that use adversarial training to generate new samples with the same (potentially very complex) statistics as the training samples. One major form of training failure, known as mode collapse, involves the generator failing to reproduce the full diversity of modes in the target probability distribution. Here, we present an effective model of GAN training, which captures the learning dynamics by replacing the generator neural network with a collection of particles in the output space; particles are coupled by a universal kernel valid for certain wide neural networks and high-dimensional inputs. The generality of our simplified model allows us to study the conditions under which mode collapse occurs. Indeed, experiments which vary the effective kernel of the generator reveal a mode collapse transition, the shape of which can be related to the type of discriminator through the frequency principle. Further, we find that gradient regularizers of intermediate strengths can optimally yield convergence through critical damping of the generator dynamics. Our effective GAN model thus provides an interpretable physical framework for understanding and improving adversarial training.
translated by 谷歌翻译
随着自动化许多具有高保真性的化学任务的前景,化学语言处理模型正在快速迅速出现。在这里,我们提出了一个基于云的实时平台,该平台允许用户实际上筛选感兴趣的分子。为此,将杠杆化从最近提出的大型化学语言模型(名为Moleformer)推断出来的分子嵌入。该平台目前支持三个任务:最近的邻居检索,化学空间可视化和财产预测。根据该平台的功能并获得的结果,我们认为这样的平台可以在自动化化学和化学工程研究中起关键作用,并协助药物发现和材料设计任务。在\ url {www.ibm.biz/molecular_demo}提供我们平台的演示。
translated by 谷歌翻译
深层神经网络目前为显微镜图像细胞分割提供了令人鼓舞的结果,但是它们需要大规模标记的数据库,这是一个昂贵且耗时的过程。在这项工作中,我们通过将自我监督与半监督的学习相结合来放松标签要求。我们提出了基于边缘的地图的预测,以自我监督未标记的图像的训练,该图像与少数标记的图像的监督培训相结合,用于学习分割任务。在我们的实验中,我们在几次显微镜图像细胞分割基准上进行了评估,并表明只有少数注释的图像,例如原始训练集的10%足以让我们的方法与1到10次的完全注释的数据库达到类似的性能。我们的代码和训练有素的模型公开可用
translated by 谷歌翻译
在快速增长的世界中,分散学习算法的设计很重要,在这个世界中,数据分布在有限的本地计算资源和通信的参与者上。在这个方向上,我们提出了一种在线算法最小化从网络上分布的单个数据/模型汇总的非凸损失函数。我们提供算法的理论性能保证,并在现实生活中展示其实用性。
translated by 谷歌翻译
对可解释的AI(XAI)的需求已经很好,但是在监督学习范式之外,几乎没有发表相对较少的发表。本文着重于将解释性和解释性应用于无监督异常检测任务的原则方法。我们认为,解释性主要是一项算法任务,解释性主要是认知任务,并利用认知科学的见解,提出了一种通用方法,用于使用解释异常进行实践诊断。我们定义归因误差,并使用现实世界标记的数据集证明我们基于集成梯度(IG)的方法比替代方法所产生的归因误差明显低。
translated by 谷歌翻译
借助大量可用数据,许多企业寻求实施以数据为驱动的规范分析,以帮助他们做出明智的决定。这些规定的政策需要满足操作约束,并主动消除规则冲突,这两者在实践中无处不在。他们也需要简单且可解释,因此可以轻松地验证和实施它们。文献中的现有方法围绕构建规定决策树的变体以生成可解释的政策。但是,现有方法都无法处理约束。在本文中,我们提出了一种可扩展的方法,该方法解决了受限的规定政策生成问题。我们介绍了一种新型的基于路径的混合智能程序(MIP)公式,该计划通过列生成有效地标识了(接近)最佳策略。生成的策略可以表示为多道路拆分树,由于其较短的规则,它比二进制树更容易解释和信息。我们通过对合成数据集和真实数据集进行了广泛的实验来证明我们方法的功效。
translated by 谷歌翻译